智能论文笔记

Code Representation Learning with Prüfer Sequences

Tenzin Jinpa , Yong Gao

分类：人工智能

2021-11-14

计算机程序的源代码的有效和有效的编码对于计算机程序理解中的任务的顺序对深神经网络模型的成功至关重要，例如自动化代码摘要和文档。一项重大挑战是找到一个顺序表示，该表示可以在计算机程序中捕获结构/句法信息，并促进学习模型的培训。在本文中，我们建议使用计算机程序的PR \“UFER序列（AST）的计算机程序的PR \”UFER序列（AST）来设计一个保持AST中的结构信息的顺序表示方案。我们的代表可以发展深层 - 学习模型，其中训练示例中的词汇标记携带的信号可以根据其句法角色和重要性自动且选择性地利用。与其他最近建议的方法不同，我们的代表在AST的结构信息方面简洁无损。现实世界基准数据集的实证研究，使用我们设计用于代码摘要的序列序列学习模型，表明我们的PR \“基于UFER序列的表示确实具有高效和高效，优先于最近建议的我们用作基线模型的深度学习模型。

translated by 谷歌翻译